在非结构化环境中工作的机器人必须能够感知和解释其周围环境。机器人技术领域基于深度学习模型的主要障碍之一是缺乏针对不同工业应用的特定领域标记数据。在本文中,我们提出了一种基于域随机化的SIM2REAL传输学习方法,用于对象检测,可以自动生成任意大小和对象类型的标记的合成数据集。随后,对最先进的卷积神经网络Yolov4进行了训练,以检测不同类型的工业对象。通过提出的域随机化方法,我们可以在零射击和单次转移的情况下分别缩小现实差距,分别达到86.32%和97.38%的MAP50分数,其中包含190个真实图像。在GEFORCE RTX 2080 TI GPU上,数据生成过程的每图像少于0.5 s,培训持续约12H,这使其方便地用于工业使用。我们的解决方案符合工业需求,因为它可以通过仅使用1个真实图像进行培训来可靠地区分相似的对象类别。据我们所知,这是迄今为止满足这些约束的唯一工作。
translated by 谷歌翻译
Federated learning has become a popular machine learning paradigm with many potential real-life applications, including recommendation systems, the Internet of Things (IoT), healthcare, and self-driving cars. Though most current applications focus on classification-based tasks, learning personalized generative models remains largely unexplored, and their benefits in the heterogeneous setting still need to be better understood. This work proposes a novel architecture combining global client-agnostic and local client-specific generative models. We show that using standard techniques for training federated models, our proposed model achieves privacy and personalization that is achieved by implicitly disentangling the globally-consistent representation (i.e. content) from the client-dependent variations (i.e. style). Using such decomposition, personalized models can generate locally unseen labels while preserving the given style of the client and can predict the labels for all clients with high accuracy by training a simple linear classifier on the global content features. Furthermore, disentanglement enables other essential applications, such as data anonymization, by sharing only content. Extensive experimental evaluation corroborates our findings, and we also provide partial theoretical justifications for the proposed approach.
translated by 谷歌翻译
时间序列预测是一项强大的数据建模学科,可以分析历史观察以预测时间序列的未来价值。它已用于许多应用程序,包括但不限于经济学,气象和健康。在本文中,我们使用时间序列预测技术来建模和预测水痘的未来发生率。为了实现这一目标,我们在匈牙利收集的数据集上实现并模拟了多个模型和数据预处理技术。我们证明,在县级预测方面,LSTM模型在绝大多数实验中的所有其他模型都优于所有其他模型,而Sarimax模型在国家一级表现最佳。我们还证明,传统数据预处理方法的性能不如我们提出的数据预处理方法的性能。
translated by 谷歌翻译
Federated learning (FL) has been proposed as a privacy-preserving approach in distributed machine learning. A federated learning architecture consists of a central server and a number of clients that have access to private, potentially sensitive data. Clients are able to keep their data in their local machines and only share their locally trained model's parameters with a central server that manages the collaborative learning process. FL has delivered promising results in real-life scenarios, such as healthcare, energy, and finance. However, when the number of participating clients is large, the overhead of managing the clients slows down the learning. Thus, client selection has been introduced as a strategy to limit the number of communicating parties at every step of the process. Since the early na\"{i}ve random selection of clients, several client selection methods have been proposed in the literature. Unfortunately, given that this is an emergent field, there is a lack of a taxonomy of client selection methods, making it hard to compare approaches. In this paper, we propose a taxonomy of client selection in Federated Learning that enables us to shed light on current progress in the field and identify potential areas of future research in this promising area of machine learning.
translated by 谷歌翻译
Hamiltonian Monte Carlo(HMC)是Markov链算法,用于从具有密度$ e^{ - f(x)} $的高维分布中进行采样,可访问$ f $的梯度。一种特殊的感兴趣的情况是带有协方差矩阵$ \ sigma $的$ d $二维高斯分布,在这种情况下$ f(x)= x^\ top \ top \ sigma^{ - 1} x $。我们表明,HMC可以使用$ \ wideTilde {o}(\ sqrt {\ kappa} d^{1/4} \ log(1/\ varepsilon),使用$ \ varepsilon $ -close在总变化距离中取样。)$渐变查询,其中$ \ kappa $是$ \ sigma $的条件号。我们的算法对哈密顿动力学使用了长时间和随机的整合时间。这与最近的结果(并受到了)的形成对比,该结果给出了$ \ widetilde \ omega(\ kappa d^{1/2})$查询的HMC较低限制,即使是高斯案例,也有固定的集成时间。
translated by 谷歌翻译
单词如何改变他们的含义?尽管语义演化是由多种不同的因素(包括语言,社会和技术方面的)驱动的,但我们发现,有一项法律在五种主要的印欧语语言中普遍存在:这种语义演化非常宽容。使用控制基础对称性的直觉分布语义嵌入的自动管道,我们表明单词遵循含义空间中的随机轨迹,具有异常扩散指数$ \ alpha = 0.45 \ pm 0.05 \ pm 0.05 \ pm 0.05 $ 0.05 $,相反,与扩散的粒子相比之下\ alpha = 1 $。随机化方法表明,在语义变化方向上保留时间相关性是为了恢复强烈延伸的行为所必需的。但是,变化大小的相关性也起着重要作用。我们此外表明,在数据分析和解释中,强大的亚扩散是一种强大的现象,例如选择拟合位移平均值或平均单个单词轨迹的最佳拟合指数的选择。
translated by 谷歌翻译
时间序列的异常提供了各个行业的关键方案的见解,从银行和航空航天到信息技术,安全和医学。但是,由于异常的定义,经常缺乏标签以及此类数据中存在的极为复杂的时间相关性,因此识别时间序列数据中的异常尤其具有挑战性。LSTM自动编码器是基于长期短期内存网络的异常检测的编码器传统方案,该方案学会重建时间序列行为,然后使用重建错误来识别异常。我们将Denoising Architecture作为对该LSTM编码模型模型的补充,并研究其对现实世界以及人为生成的数据集的影响。我们证明了所提出的体系结构既提高了准确性和训练速度,从而使LSTM自动编码器更有效地用于无监督的异常检测任务。
translated by 谷歌翻译
在这项工作中,我们提出了新的自适应步长策略,以改善几种随机梯度方法。我们的第一种方法(停止)基于经典的Polyak步长(Polyak,1987),是随机优化SPS(Loizou等,2021)的最新开发的延伸,我们的第二种方法,以及我们的第二种方法表示毕业生,通过“随机梯度的多样性”重新缩放步长。我们对这些方法进行了理论分析,以实现强烈凸平的光滑功能,并表明尽管随机梯度随机梯度,它们仍享有确定性的速率。此外,我们证明了自适应方法对二次目标的理论优势。不幸的是,两个停止和毕业生都取决于未知数量,这仅适用于过度散光模型。为了解决这个问题,我们放弃了这种不希望的依赖性,并重新定义了停止和毕业生的停止和毕业。我们表明,这些新方法在相同的假设下线性收敛到最佳解决方案的邻域。最后,我们通过实验验证来证实我们的理论主张,这表明GRAD对于深度学习优化特别有用。
translated by 谷歌翻译
Federated Learning(FL)是一种新兴的机器学习范式,涉及多个客户,例如手机设备,并激励了协作解决由中央服务器协调的机器学习问题。FL是由Kone \ V {C} N \'{Y}等人提出的。和McMahan等。作为传统集中机器学习的可行保护替代方案,因为通过构造,培训数据点被分散,并且从未由客户转移到中央服务器上。因此,在一定程度上,FL会减轻与集中数据收集相关的隐私风险。不幸的是,FL面对FL的优化通常不需要处理的几个特定问题。在本论文中,我们确定了其中一些挑战,并提出了新的方法和算法来解决这些挑战,最终目标是实现由数学上严格的保证支持的实用FL解决方案。
translated by 谷歌翻译
本文介绍了一种基于输入输出对的有限样本的有限带限制函数构建置信带的方法。该方法是免费的W.R.T.假定观察噪声,并且仅假定输入分布的知识。它是非参数,也就是说,它不需要回归函数的参数模型,并且区域具有非征收保证。该算法基于paley-fiener的理论,再现了内核希尔伯特空间。本文首先研究了完全可观察到的变体,当观测值没有噪音并且只有输入是随机的。然后,它使用梯度扰动方法将思想概括为嘈杂的情况。最后,提出了证明两种情况的数值实验。
translated by 谷歌翻译